1.1. 分子酶切及拼接分析

本程序所有代码及案例文件

1.1.1. 酶切分析

1.1.1.1. 读入数据

% 读入PCR正链序列

PCR='ACCACCATGGATGAAAATTAGACCACTTGGTGACAGAGTTGTTATTAAAAGATTAGAGGCAGAGGAGACTACTAAGAGCGGTATAGTATTACCTAGCTCAGCTAAAGAGAAACCTCAAATGGCAGAAGTTGTTGCAGTAGGTCCTGGTGGAGTTGTAGATGGCAAAGAAATTCAAATGCAAGTAAAGACAGGAGATAAAGTATTTTTCTCCAAATACAGTGGAACAGAAATAAAAGTTGACAATGAAGAATTGTTAATTTTAAGACAGGACGATATTTTAGGAATTGTAGAAGAATAAGCTATCAATTTTGTTAATAATTCAGGGAGGGATTCTAAATGGCAAAGCAAATATTATACGGAGAAGAAGCAAGAAGATCTATGCAAAAGGGCGTAGACAAACTTGCTGATACTGTTAAGGTTACTCTTGGACCAAAAGGAAGAAATGTTGTTTTAGATAAAAAATTTGGAGCACCACTTATAACAAATGATGGTGTAAGTATAGCAAAAGAAATAGAACTTGAAGATCCATATGAAAATATGGGTGCACAACTTGTTAAGGAAGTTGCAACTAAGACTAATGATGTAGCAGGAGACGGAACTACTACAGCAACACTTCTTGCACAAGCAATAATAAGAGAAGGACTTAAAAATGTTACAGCTGGAGCTAATCCAATGCTTATAAGAAATGGAATAAGATTAGCTGTAGATAAGACTGTTGAAGGACTTAAGAAAGTATCAAAGAATGTTAACGGAAAAGAAGATATAGCAAGAGTTGCATCAATTTCAGCAGCAGATCCTGAAATAGGAAAATTAATAGCTGATGCTATGGAGAAAGTAGGCAACGAAGGAGTTATAACTGTTGAAGAATCAAAATCAATGGGAACAGAACTTGATGTTGTTGAAGGTATGCAATTTGATAGAGGATATTTAAGCCCATACATGGTAACAGATCAAGAGAAAATGGAAGCTGTACTTGATGATCCATATATATTAATAACAGACAAGAAAATTGCAAATATACAAGAAATTCTTCCACTTCTTGAGCAGATAGTTCAACAGGGTAAAAAATTACTTATAATTGCTGATGATGTTGAAGGCGAAGCTTTAGCTACATTGGTTGTTAACAAATTAAGAGGAACATTTAACTGTGTTGCTGTTAAAGCTCCTGGATTTGGCGATAGAAGAAAAGATATGTTAAGAGACATAGCAATCCTTACAGGTGGAGAAGTTATATCAGAAGAGCTTGGAAAAGATCTTAAAGATGTAAAGGTTGAGGATCTTGGAAGTGCTGAAAGCGTTAAAATATCAAAAGAAAATACTACAATAGTAAATGGAAGAGGCGACAAGAGCGCAATCCATGACAGAGTTGCGCAAATAAGAGGTCAAATAGAAGAAACTACATCTGACTTTGATAGAGAAAAATTACAAGAAAGATTAGCAAAACTTGCTGGTGGAGTTGCAGTTGTTAAAGTTGGAGCTGCTTCAGAAACTGAATTAAAAGAGAGAAAAATGAGAATTGAAGATGCTCTTGCAGCTACAAAAGCAGCAGTTGAAGAAGGTATAATTGCTGGTGGTGGTACTGCTTACATCAATGTATTACCAGAAGTAAGAGAATTGACTTCAGACGAACCAGATGTTCAAGTTGGTATAAATATAATAGTTAAGGCTCTTGAAGAACCAGTAAGACAAATAGCTGCAAATGCAGGTCTTGAGGGATCAGTAATAATAGAAAAAATTATAAACAGTGAAAAAGGAATTGGATTTGATGCATTACATGAGAAATATGTTGATATGCTAAGTGTTGGAATTGTTGATCCAACTAAGGTTACAAGATCAGCACTTCAAAATGCGGCATCAGTTGCTTCAACATTCCTTACAACTGAGTGCGCTGTAGCAGATATTCCTGAAAAAGATAAACCTGAAATGCCAGGTGGAGCACCAGGAATGGGAATGGGCGGAATGTACTAAGGATCCTGGT'

PCR =
'ACCACCATGGATGAAAATTAGACCACTTGGTGACAGAGTTGTTATTAAAAGATTAGAGGCAGAGGAGACTACTAAGAGCGGTATAGTATTACCTAGCTCAGCTAAAGAGAAACCTCAAATGGCAGAAGTTGTTGCAGTAGGTCCTGGTGGAGTTGTAGATGGCAAAGAAATTCAAATGCAAGTAAAGACAGGAGATAAAGTATTTTTCTCCAAATACAGTGGAACAGAAATAAAAGTTGACAATGAAGAATTGTTAATTTTAAGACAGGACGATATTTTAGGAATTGTAGAAGAATAAGCTATCAATTTTGTTAATAATTCAGGGAGGGATTCTAAATGGCAAAGCAAATATTATACGGAGAAGAAGCAAGAAGATCTATGCAAAAGGGCGTAGACAAACTTGCTGATACTGTTAAGGTTACTCTTGGACCAAAAGGAAGAAATGTTGTTTTAGATAAAAAATTTGGAGCACCACTTATAACAAATGATGGTGTAAGTATAGCAAAAGAAATAGAACTTGAAGATCCATATGAAAATATGGGTGCACAACTTGTTAAGGAAGTTGCAACTAAGACTAATGATGTAGCAGGAGACGGAACTACTACAGCAACACTTCTTGCACAAGCAATAATAAGAGAAGGACTTAAAAATGTTACAGCTGGAGCTAATCCAATGCTTATAAGAAATGGAATAAGATTAGCTGTAGATAAGACTGTTGAAGGACTTAAGAAAGTATCAAAGAATGTTAACGGAAAAGAAGATATAGCAAGAGTTGCATCAATTTCAGCAGCAGATCCTGAAATAGGAAAATTAATAGCTGATGCTATGGAGAAAGTAGGCAACGAAGGAGTTATAACTGTTGAAGAATCAAAATCAATGGGAACAGAACTTGATGTTGTTGAAGGTATGCAATTTGATAGAGGATATTTAAGCCCATACATGGTAACAGATCAAGAGAAAATGGAAGCTGTACTTGATGATCCATATATATTAATAACAGACAAGAAAATTGCAAATATACAAGAAATTCTTCCACTTCTTGAGCAGATAGTTCAACAGGGTAAAAAATTACTTATAATTGCTGATGATGTTGAAGGCGAAGCTTTAGCTACATTGGTTGTTAACAAATTAAGAGGAACATTTAACTGTGTTGCTGTTAAAGCTCCTGGATTTGGCGATAGAAGAAAAGATATGTTAAGAGACATAGCAATCCTTACAGGTGGAGAAGTTATATCAGAAGAGCTTGGAAAAGATCTTAAAGATGTAAAGGTTGAGGATCTTGGAAGTGCTGAAAGCGTTAAAATATCAAAAGAAAATACTACAATAGTAAATGGAAGAGGCGACAAGAGCGCAATCCATGACAGAGTTGCGCAAATAAGAGGTCAAATAGAAGAAACTACATCTGACTTTGATAGAGAAAAATTACAAGAAAGATTAGCAAAACTTGCTGGTGGAGTTGCAGTTGTTAAAGTTGGAGCTGCTTCAGAAACTGAATTAAAAGAGAGAAAAATGAGAATTGAAGATGCTCTTGCAGCTACAAAAGCAGCAGTTGAAGAAGGTATAATTGCTGGTGGTGGTACTGCTTACATCAATGTATTACCAGAAGTAAGAGAATTGACTTCAGACGAACCAGATGTTCAAGTTGGTATAAATATAATAGTTAAGGCTCTTGAAGAACCAGTAAGACAAATAGCTGCAAATGCAGGTCTTGAGGGATCAGTAATAATAGAAAAAATTATAAACAGTGAAAAAGGAATTGGATTTGATGCATTACATGAGAAATATGTTGATATGCTAAGTGTTGGAATTGTTGATCCAACTAAGGTTACAAGATCAGCACTTCAAAATGCGGCATCAGTTGCTTCAACATTCCTTACAACTGAGTGCGCTGTAGCAGATATTCCTGAAAAAGATAAACCTGAAATGCCAGGTGGAGCACCAGGAATGGGAATGGGCGGAATGTACTAAGGATCCTGGT'

1.1.1.2. 对片段进行酶切

restrict_xia是matlab自带函数restrict的升级版,用法相同,但更加的灵活。可以直接用多个酶对片段进行循环处理,中间不用担心结果存放问题。

%用BamHI剪切

PCR_zheng=restrict_xia(PCR,'BamHI')

PCR_zheng = 2×1 cell 数组

'ACCACCATGGATGAAAATTAGACCACT…
'GATCCTGGT'

% 用NcoI剪切

PCR_zheng=restrict_xia(PCR_zheng,'NcoI')

PCR_zheng = 3×1 cell 数组

'ACCAC'
'CATGGATGAAAATTAGACCACTTGGTG…
'GATCCTGGT'
%正链分析完毕

%--------------------------------------------

1.1.1.3. 对反链进行分析

具体过程同上,用法同matlab自带的restrict。

PCR_c=seqcomplement(PCR) % PCR互补链

PCR_c =
'TGGTGGTACCTACTTTTAATCTGGTGAACCACTGTCTCAACAATAATTTTCTAATCTCCGTCTCCTCTGATGATTCTCGCCATATCATAATGGATCGAGTCGATTTCTCTTTGGAGTTTACCGTCTTCAACAACGTCATCCAGGACCACCTCAACATCTACCGTTTCTTTAAGTTTACGTTCATTTCTGTCCTCTATTTCATAAAAAGAGGTTTATGTCACCTTGTCTTTATTTTCAACTGTTACTTCTTAACAATTAAAATTCTGTCCTGCTATAAAATCCTTAACATCTTCTTATTCGATAGTTAAAACAATTATTAAGTCCCTCCCTAAGATTTACCGTTTCGTTTATAATATGCCTCTTCTTCGTTCTTCTAGATACGTTTTCCCGCATCTGTTTGAACGACTATGACAATTCCAATGAGAACCTGGTTTTCCTTCTTTACAACAAAATCTATTTTTTAAACCTCGTGGTGAATATTGTTTACTACCACATTCATATCGTTTTCTTTATCTTGAACTTCTAGGTATACTTTTATACCCACGTGTTGAACAATTCCTTCAACGTTGATTCTGATTACTACATCGTCCTCTGCCTTGATGATGTCGTTGTGAAGAACGTGTTCGTTATTATTCTCTTCCTGAATTTTTACAATGTCGACCTCGATTAGGTTACGAATATTCTTTACCTTATTCTAATCGACATCTATTCTGACAACTTCCTGAATTCTTTCATAGTTTCTTACAATTGCCTTTTCTTCTATATCGTTCTCAACGTAGTTAAAGTCGTCGTCTAGGACTTTATCCTTTTAATTATCGACTACGATACCTCTTTCATCCGTTGCTTCCTCAATATTGACAACTTCTTAGTTTTAGTTACCCTTGTCTTGAACTACAACAACTTCCATACGTTAAACTATCTCCTATAAATTCGGGTATGTACCATTGTCTAGTTCTCTTTTACCTTCGACATGAACTACTAGGTATATATAATTATTGTCTGTTCTTTTAACGTTTATATGTTCTTTAAGAAGGTGAAGAACTCGTCTATCAAGTTGTCCCATTTTTTAATGAATATTAACGACTACTACAACTTCCGCTTCGAAATCGATGTAACCAACAATTGTTTAATTCTCCTTGTAAATTGACACAACGACAATTTCGAGGACCTAAACCGCTATCTTCTTTTCTATACAATTCTCTGTATCGTTAGGAATGTCCACCTCTTCAATATAGTCTTCTCGAACCTTTTCTAGAATTTCTACATTTCCAACTCCTAGAACCTTCACGACTTTCGCAATTTTATAGTTTTCTTTTATGATGTTATCATTTACCTTCTCCGCTGTTCTCGCGTTAGGTACTGTCTCAACGCGTTTATTCTCCAGTTTATCTTCTTTGATGTAGACTGAAACTATCTCTTTTTAATGTTCTTTCTAATCGTTTTGAACGACCACCTCAACGTCAACAATTTCAACCTCGACGAAGTCTTTGACTTAATTTTCTCTCTTTTTACTCTTAACTTCTACGAGAACGTCGATGTTTTCGTCGTCAACTTCTTCCATATTAACGACCACCACCATGACGAATGTAGTTACATAATGGTCTTCATTCTCTTAACTGAAGTCTGCTTGGTCTACAAGTTCAACCATATTTATATTATCAATTCCGAGAACTTCTTGGTCATTCTGTTTATCGACGTTTACGTCCAGAACTCCCTAGTCATTATTATCTTTTTTAATATTTGTCACTTTTTCCTTAACCTAAACTACGTAATGTACTCTTTATACAACTATACGATTCACAACCTTAACAACTAGGTTGATTCCAATGTTCTAGTCGTGAAGTTTTACGCCGTAGTCAACGAAGTTGTAAGGAATGTTGACTCACGCGACATCGTCTATAAGGACTTTTTCTATTTGGACTTTACGGTCCACCTCGTGGTCCTTACCCTTACCCGCCTTACATGATTCCTAGGACCA'

PCR_fan=restrict_xia(PCR_c,'CCTAGG',5); % BamHI酶解

PCR_fan=restrict_xia(PCR_fan,'GGTACC',5) % NcoI酶解

PCR_fan = 3×1 cell 数组

'TGGTGGTAC'
'CTACTTTTAATCTGGTGAACCACTGTC…
'GACCA'

1.1.1.4. 对生成的片段进行组装

由于我们平时看到的均为两条链形式,我们对上面步骤的片段进行组装。整理成几段切割的片段,每段片段为两链形式,上链方向为5→3,下链为3→5

%互补链分析完毕

%-------------------------

jieguo1=seqcombine_xia(PCR_zheng,PCR_fan) %进行序列组装

jieguo1 = 2×3 cell 数组

'ACCAC ' 'CATGGATGAAAATTAGACCACTTGGTG… 'GATCCTGGT'
'TGGTGGTAC' 'CTACTTTTAATCTGGTGAACCACTGTC… 'GACCA'

1.1.1.5. 对生成的片段进行分析

seqreport_xia可以直接给出生成的片段、粘性末端情况,并生成问题和图像两种报告形式。由于mlx文件无法运行鼠标交互,seqreport_xia无法直接运行。可在console进行运行,或邮件鼠标运行。

注明:seqreport_xia程序中,出现图片报告后,需要用鼠标选择文字标注所在的位置(gtext函数)

% seqreport_xia(jieguo1) %生成序列报告

%--------------------

%以上PCR分析完毕

%---------------------------------------------------------------------------------------

1.1.1.6. 以下为相同分析(略过)

%读入质粒正链序列

zhili=fastaread('pET 28a(+).fasta');

zhili=zhili.Sequence;

% 用BamHI剪切

zhi_zheng=restrict_xia(zhili,'BamHI')

zhi_zheng = 2×1 cell 数组

'ATCCGGATATAGTTCCTCCTTTCAGCA…
'GATCCGCGACCCATTTGCTGTCCACCA…

%用NcoI剪切

zhili_zheng=restrict_xia(zhi_zheng,'NcoI')

zhili_zheng = 3×1 cell 数组

'ATCCGGATATAGTTCCTCCTTTCAGCA…
'GATCCGCGACCCATTTGCTGTCCACCA…
'CATGGTATATCTCCTTCTTAAAGTTAA…

%正链分析完毕

%--------------------------------------------

zhili_c=seqcomplement(zhili) % PCR互补链

zhili_c =
'TAGGCCTATATCAAGGAGGAAAGTCGTTTTTTGGGGAGTTCTGGGCAAATCTCCGGGGTTCCCCAATACGATCAATAACGAGTCGCCACCGTCGTCGGTTGAGTCGAAGGAAAGCCCGAAACAATCGTCGGCCTAGAGTCACCACCACCACCACCACGAGCTCACGCCGGCGTTCGAACAGCTGCCTCGAGCTTAAGCCTAGGCGCTGGGTAAACGACAGGTGGTCAGTACGATCGGTATACCGACGGCGCGCCGTGGTCCGGCGACGACACTACTACTACTACTACCGACGACGGGTACCATATAGAGGAAGAATTTCAATTTGTTTTAATAAAGATCTCCCCTTAACAATAGGCGAGTGTTAAGGGGATATCACTCAGCATAATTAAAGCGCCCTAGCTCTAGAGCTAGGAGATGCGGCCTGCGTAGCACCGGCCGTAGTGGCCGCGGTGTCCACGCCAACGACCGCGGATATAGCGGCTGTAGTGGCTACCCCTTCTAGCCCGAGCGGTGAAGCCCGAGTACTCGCGAACAAAGCCGCACCCATACCACCGTCCGGGGCACCGGCCCCCTGACAACCCGCGGTAGAGGAACGTACGTGGTAAGGAACGCCGCCGCCACGAGTTGCCGGAGTTGGATGATGACCCGACGAAGGATTACGTCCTCAGCGTATTCCCTCTCGCAGCTCTAGGGCCTGTGGTAGCTTACCGCGTTTTGGAAAGCGCCATACCGTACTATCGCGGGCCTTCTCTCAGTTAAGTCCCACCACTTACACTTTGGTCATTGCAATATGCTACAGCGTCTCATACGGCCACAGAGAATAGTCTGGCAAAGGGCGCACCACTTGGTCCGGTCGGTGCAAAGACGCTTTTGCGCCCTTTTTCACCTTCGCCGCTACCGCCTCGACTTAATGTAAGGGTTGGCGCACCGTGTTGTTGACCGCCCGTTTGTCAGCAACGACTAACCGCAACGGTGGAGGTCAGACCGGGACGTGCGCGGCAGCGTTTAACAGCGCCGCTAATTTAGAGCGCGGCTAGTTGACCCACGGTCGCACCACCACAGCTACCATCTTGCTTCGCCGCAGCTTCGGACATTTCGCCGCCACGTGTTAGAAGAGCGCGTTGCGCAGTCACCCGACTAGTAATTGATAGGCGACCTACTGGTCCTACGGTAACGACACCTTCGACGGACGTGATTACAAGGCCGCAATAAAGAACTACAGAGACTGGTCTGTGGGTAGTTGTCATAATAAAAGAGGGTACTTCTGCCATGCGCTGACCCGCACCTCGTAGACCAGCGTAACCCAGTGGTCGTTTAGCGCGACAATCGCCCGGGTAATTCAAGACAGAGCCGCGCAGACGCAGACCGACCGACCGTATTTATAGAGTGAGCGTTAGTTTAAGTCGGCTATCGCCTTGCCCTTCCGCTGACCTCACGGTACAGGCCAAAAGTTGTTTGGTACGTTTACGACTTACTCCCGTAGCAAGGGTGACGCTACGACCAACGGTTGCTAGTCTACCGCGACCCGCGTTACGCGCGGTAATGGCTCAGGCCCGACGCGCAACCACGCCTATAGAGCCATCACCCTATGCTGCTATGGCTTCTGTCGAGTACAATATAGGGCGGCAATTGGTGGTAGTTTGTCCTAAAAGCGGACGACCCCGTTTGGTCGCACCTGGCGAACGACGTTGAGAGAGTCCCGGTCCGCCACTTCCCGTTAGTCGACAACGGGCAGAGTGACCACTTTTCTTTTTGGTGGGACCGCGGGTTATGCGTTTGGCGGAGAGGGGCGCGCAACCGGCTAAGTAATTACGTCGACCGTGCTGTCCAAAGGGCTGACCTTTCGCCCGTCACTCGCGTTGCGTTAATTACATTCAATCGAGTGAGTAATCCGTGGCCCTAGAGCTGGCTACGGGAACTCTCGGAAGTTGGGTCAGTCGAGGAAGGCCACCCGCGCCCCGTACTGATAGCAGCGGCGTGAATACTGACAGAAGAAATAGTACGTTGAGCATCCTGTCCACGGCCGTCGCGAGACCCAGTAAAAGCCGCTCCTGGCGAAAGCGACCTCGCGCTGCTACTAGCCGGACAGCGAACGCCATAAGCCTTAGAACGTGCGGGAGCGAGTTCGGAAGCAGTGACCAGGGCGGTGGTTTGCAAAGCCGCTCTTCGTCCGGTAATAGCGGCCGTACCGCCGGGGTGCCCACGCGTACTAGCACGAGGACAGCAACTCCTGGGCCGATCCGACCGCCCCAACGGAATGACCAATCGTCTTACTTAGTGGCTATGCGCTCGCTTGCACTTCGCTGACGACGACGTTTTGCAGACGCTGGACTCGTTGTTGTACTTACCAGAAGCCAAAGGCACAAAGCATTTCAGACCTTTGCGCCTTCAGTCGCGGGACGTGGTAATACAAGGCCTAGACGTAGCGTCCTACGACGACCGATGGGACACCTTGTGGATGTAGACATAATTGCTTCGCGACCGTAACTGGGACTCACTAAAAAGAGACCAGGGCGGCGTAGGTATGGCGGTCAACAAATGGGAGTGTTGCAAGGTCATTGGCCCGTACAAGTAGTAGTCATTGGGCATAGCACTCGTAGGAGAGAGCAAAGTAGCCATAGTAATGGGGGTACTTGTCTTTAGGGGGAATGTGCCTCCGTAGTCACTGGTTTGTCCTTTTTTGGCGGGAATTGTACCGGGCGAAATAGTCTTCGGTCTGTAATTGCGAAGACCTCTTTGAGTTGCTCGACCTGCGCCTACTTGTCCGTCTGTAGACACTTAGCGAAGTGCTGGTGCGACTACTCGAAATGGCGTCGACGGAGCGCGCAAAGCCACTACTGCCACTTTTGGAGACTGTGTACGTCGAGGGCCTCTGCCAGTGTCGAACAGACATTCGCCTACGGCCCTCGTCTGTTCGGGCAGTCCCGCGCAGTCGCCCACAACCGCCCACAGCCCCGCGTCGGTACTGGGTCAGTGCATCGCTATCGCCTCACATATGACCGAATTGATACGCCGTAGTCTCGTCTAACATGACTCTCACGTGGTATATACGCCACACTTTATGGCGTGTCTACGCATTCCTCTTTTATGGCGTAGTCCGCGAGAAGGCGAAGGAGCGAGTGACTGAGCGACGCGAGCCAGCAAGCCGACGCCGCTCGCCATAGTCGAGTGAGTTTCCGCCATTATGCCAATAGGTGTCTTAGTCCCCTATTGCGTCCTTTCTTGTACACTCGTTTTCCGGTCGTTTTCCGGTCCTTGGCATTTTTCCGGCGCAACGACCGCAAAAAGGTATCCGAGGCGGGGGGACTGCTCGTAGTGTTTTTAGCTGCGAGTTCAGTCTCCACCGCTTTGGGCTGTCCTGATATTTCTATGGTCCGCAAAGGGGGACCTTCGAGGGAGCACGCGAGAGGACAAGGCTGGGACGGCGAATGGCCTATGGACAGGCGGAAAGAGGGAAGCCCTTCGCACCGCGAAAGAGTATCGAGTGCGACATCCATAGAGTCAAGCCACATCCAGCAAGCGAGGTTCGACCCGACACACGTGCTTGGGGGGCAAGTCGGGCTGGCGACGCGGAATAGGCCATTGATAGCAGAACTCAGGTTGGGCCATTCTGTGCTGAATAGCGGTGACCGTCGTCGGTGACCATTGTCCTAATCGTCTCGCTCCATACATCCGCCACGATGTCTCAAGAACTTCACCACCGGATTGATGCCGATGTGATCTTCCTGTCATAAACCATAGACGCGAGACGACTTCGGTCAATGGAAGCCTTTTTCTCAACCATCGAGAACTAGGCCGTTTGTTTGGTGGCGACCATCGCCACCAAAAAAACAAACGTTCGTCGTCTAATGCGCGTCTTTTTTTCCTAGAGTTCTTCTAGGAAACTAGAAAAGATGCCCCAGACTGCGAGTCACCTTGCTTTTGAGTGCAATTCCCTAAAACCAGTACTTGTTATTTTGACAGACGAATGTATTTGTCATTATGTTCCCCACAATACTCGGTATAAGTTGCCCTTTGCAGAACGAGATCCGGCGCTAATTTAAGGTTGTACCTACGACTAAATATACCCATATTTACCCGAGCGCTATTACAGCCCGTTAGTCCACGCTGTTAGATAGCTAACATACCCTTCGGGCTACGCGGTCTCAACAAAGACTTTGTACCGTTTCCATCGCAACGGTTACTACAATGTCTACTCTACCAGTCTGATTTGACCGACTGCCTTAAATACGGAGAAGGCTGGTAGTTCGTAAAATAGGCATGAGGACTACTACGTACCAATGAGTGGTGACGCTAGGGGCCCTTTTGTCGTAAGGTCCATAATCTTCTTATAGGACTAAGTCCACTTTTATAACAACTACGCGACCGTCACAAGGACGCGGCCAACGTAAGCTAAGGACAAACATTAACAGGAAAATTGTCGCTAGCGCATAAAGCAGAGCGAGTCCGCGTTAGTGCTTACTTATTGCCAAACCAACTACGCTCACTAAAACTACTGCTCGCATTACCGACCGGACAACTTGTTCAGACCTTTCTTTACGTATTTGAAAACGGTAAGAGTGGCCTAAGTCAGCAGTGAGTACCACTAAAGAGTGAACTATTGGAATAAAAACTGCTCCCCTTTAATTATCCAACATAACTACAACCTGCTCAGCCTTAGCGTCTGGCTATGGTCCTAGAACGGTAGGATACCTTGACGGAGCCACTCAAAAGAGGAAGTAATGTCTTTGCCGAAAAAGTTTTTATACCATAACTATTAGGACTATACTTATTTAACGTCAAAGTAAACTACGAGCTACTCAAAAAGATTCTTAATTAAGTACTCGCCTATGTATAAACTTACATAAATCTTTTTATTTGTTTATCCCCAAGGCGCGTGTAAAGGGGCTTTTCACGGTGGACTTTAACATTTGCAATTATAAAACAATTTTAAGCGCAATTTAAAAACAATTTAGTCGAGTAAAAAATTGGTTATCCGGCTTTAGCCGTTTTAGGGAATATTTAGTTTTCTTATCTGGCTCTATCCCAACTCACAACAAGGTCAAACCTTGTTCTCAGGTGATAATTTCTTGCACCTGAGGTTGCAGTTTCCCGCTTTTTGGCAGATAGTCCCGCTACCGGGTGATGCACTTGGTAGTGGGATTAGTTCAAAAAACCCCAGCTCCACGGCATTTCGTGATTTAGCCTTGGGATTTCCCTCGGGGGCTAAATCTCGAACTGCCCCTTTCGGCCGCTTGCACCGCTCTTTCCTTCCCTTCTTTCGCTTTCCTCGCCCGCGATCCCGCGACCGTTCACATCGCCAGTGCGACGCGCATTGGTGGTGTGGGCGGCGCGAATTACGCGGCGATGTCCCGCGCAGGGTAAGCGGT'

zhili_fan=restrict_xia(zhili_c,'CCTAGG',5); % BamHI酶解
zhili_fan=restrict_xia(zhili_fan,'GGTACC',5) % NcoI酶解
zhili_fan = 3×1 cell 数组

'TAGGCCTATATCAAGGAGGAAAGTCGT…
'GCGCTGGGTAAACGACAGGTGGTCAGT…
'CATATAGAGGAAGAATTTCAATTTGTT…

%反链分析完毕

%-------------------------

jieguo2=seqcombine_xia(zhili_zheng,zhili_fan) %进行序列组装

jieguo2 = 2×3 cell 数组

'ATCCGGATATAGTTCCTCCTTTCAGCA… 'GATCCGCGACCCATTTGCTGTCCACCA…
'CATGGTATATCTCCTTCTTAAAGTTAA…
'TAGGCCTATATCAAGGAGGAAAGTCGT… 'GCGCTGGGTAAACGACAGGTGGTCAGT…
'CATATAGAGGAAGAATTTCAATTTGTT…

% seqreport_xia(jieguo2) %生成分析报告

% 以上质粒分析完毕!

1.1.2. 对粘性末端进行拼接

1.1.2.1. 首先对末端进行提取

说明:

为了用字母表征粘性末端,我们独创了一种方法:如 ‘LP-CATG-RB- CTAG’,其中L和R分别表示左端和右端,P(top)和B(bottom)分别表示末端位于上链还是下链。

ends1=endsget_xia(jieguo1)
ends1 = 1×3 cell 数组

'RB-GTAC' 'LP-CATG-RB-CTAG' 'LP-GATC'

ends2=endsget_xia(jieguo2)

ends2 = 1×3 cell 数组

'RB-CTAG' 'LP-GATC-RB-GTAC' 'LP-CATG'

1.1.2.2. 建立末端数据库

1.1.2.2.1. 提取各个片段的末端

特别需要注意的是:由于编程中,习惯将上链表示为正链,下链为反方向。所以,如果粘性末端位于反链,则对其进行求补(即标准化)。endextract_xia可以从末段中提取末端,并根据所在位置(上链还是下链,进行标准化)

ends_extracted=endextract_xia([ends1,ends2]) % endextract_xia已经包含了标准化操作

ends_extracted = 1×8 cell 数组

'CATG' 'CATG' 'GATC' 'GATC' 'GATC' 'GATC' 'CATG' 'CATG'

1.1.2.2.2. 对末端进行去重,构建数据库

ends_num=unique(ends_extracted) %利用unique进行去重

ends_num = 1×2 cell 数组

'CATG' 'GATC'

1.1.2.3. 将片段末端进行数字化处理

1.1.2.3.1. 将末端转化为数字

1)ends_num为2.2.2中数据库中的粘性末端。其编号及2.2.2中末端在cell中的位置

2)endnumbered_xia将待分析DNA片段的末端进行编号化处理。其中0表示平头端。12表示该左端为数据库中第一个粘性末端,2该片段右端为数据库的第二个粘性末端

[endnumbered1] = endnumbered_xia([ends1,ends2],ends_num)% 正向序列

endnumbered1 = 1×6 cell 数组

'01' '12' '20' '02' '21' '10'

3)片段可能有翻转的情况,把该种情况也加入进来。因此,一个片段包含两种状态:正向和反向。其编号对应着endnumbered中所在位置。

endnumbered2=cellfun(@fliplr,endnumbered1,'UniformOutput',false);

endnumbered=[endnumbered1,endnumbered2]

endnumbered = 1×12 cell 数组

'01' '12' '20' '02' '21' '10' '10' '21' '02' '20' '12' '01'

1.1.2.4. 进行分子对接实验

1.1.2.4.1. 制定对接规则

可以根据自己实际需要,选择对接的规则,并将其放在paris中

% 比如,我们这次实验,根据实际情况可知,只有2和5有可能反复重复,假设可以重复3次

pairs=nchoosek(repmat([2,5,8,11],1,3),3);

% paris可以自由规定

1.1.2.4.2. 计算可能的对接结果

根据以上分析,我们构建了一套考察分子连接的方法:

1)只有相同的末端,才能够连接,如{0,1},{1,2}带有这种末端的两个片段可以链接,因为其有共同的末端2

2)链接片段中,除首末端外,中间不允许出现0,因为0无法与其他进行链接;

3)最后对生成的结果进行去重;

seqpairs=unique(seqsprlinks_xia(endnumbered,pairs),'rows')

seqpairs = 16×3

2 5 2
2 5 11
2 8 2
2 8 11
5 2 5
5 2 8
5 11 5
5 11 8
8 2 5
8 2 8
用户留言